AI 史话_草庐IT

（一文读懂）【OPEN AI SORA技术报告】视频生成模型SORA作为世界模拟器-Video generation models as world simulators

引言本文内容来自OPENAI技术报告>。概述我们探索了在视频数据上进行大规模生成模型的训练。具体来说，我们联合训练了文本条件扩散模型，这些模型适用于不同时长、分辨率和纵横比的视频和图像。我们利用了一种基于Transformer的架构，该架构可以对视频和图像的潜在编码进行时空块操作。我们最大的模型Sora能够生成一分钟的高保真视频。我们的结果表明，扩展视频生成模型是构建通用物理世界模拟器的一条有前景的途径。技术报告摘要：本技术报告主要关注两个核心方面：(1)我们提出的方法，该方法能够将各种类型的视觉数据转化为统一表示，从而支持生成模型的大规模训练；(2)对Sora模型的能力和局限性的定性评估。本

法国 AI 公司 Mistral 获微软投资，推出聊天机器人 Le Chat 挑战 ChatGPT

2月27日消息，近日，备受瞩目的法国AI公司Mistral宣布推出其AI聊天机器人LeChat。这款聊天机器人被视为ChatGPT的有力竞争者，旨在成为用户与Mistral旗下各类模型（例如MistralLarge、MistralSmall和Next）进行交互的“对话入口”。目前，LeChat已开放Beta测试，用户可以通过注册成为Beta测试者进行体验。此外，Mistral还提供了一个“企业版”，该版本具备“自主部署能力”和“精细的审核机制”。与提供免费和付费套餐的ChatGPT类似，LeChat也提供免费和付费版本。但不同于ChatGPTPlus每月20美元的固定费用，LeChat采用基于

苹果十年造车梦碎！2000人大裁员或转岗AI，烧光近百亿美元引马斯克狂喜

苹果十年造车，彻底梦碎——泰坦计划终结！也就是说，这十年里苹果投的数十亿美元，彻底打了水漂。就在刚刚，这一消息在苹果内部传开了，员工错愕。摆在2000名员工面前的命运，是要么转岗，要么走人。而苹果押注的下一个风口，就是生成式AI。据悉，许多特殊项目组员工将被移至JohnGiannandrea领导的人工智能部门，专注于开发生成式AI项目。这条科技树，苹果果真是点歪了？这次，泰坦计划是真碎了上一次我们听说苹果造车梦碎的消息，还是在1个月前。当时的说法是，库克决定把自动驾驶从L5降级到L2，而且发布日期也延期到了2028年。谁能想到，短短1个月后，泰坦计划彻底没了。显然，计划中10万美元的电车能否给

老黄祭出全新RTX 500 GPU，AIGC性能狂飙14倍！AI应用的门槛彻底被打下来了

在巴塞罗那举行的世界移动大会（MWC2024）上，英伟达发布了最新款的入门级移动版工作站GPU，RTX500Ada和RTX1000Ada。这两款入门级移动工作站GPU与之前发布的RTX2000、3000、3500、4000和5000一起，构成了英伟达移动工作站GPU的整个产品线。按照英伟达官方的说法，配备了入门级GPU的笔记本电脑，相较于使用CPU来处理AI任务的设备，效率能暴增14倍！这两款新的GPU，将会在今年第一季度搭载在OEM的合作伙伴推出的笔记本电脑中上市。入门级工作站移动GPU，补全产品线的最后一块拼图从功耗上我们就能看出来，这两款入门级的产品基本上是针对轻薄本推出的产品。虽然配备

消息称谷歌与部分出版商达成合作，使用生成式 AI 工具创作新闻内容

2月28日消息，据Adweek报道，谷歌正悄然与部分出版商达成协议，使用新的生成式人工智能(AI)工具创作新闻内容。这些合作协议据称每年价值数万美元，似乎是谷歌新闻倡议(GNI)的一部分。GNI是一项为期六年的计划，为新闻机构提供媒体素养项目、事实核查工具和其他资源。然而，此举涉及生成式AI内容创作，可能会引发争议。报道称，该计划目前针对“少数”小型出版商，测试工具可以让资源不足的出版商更有效地创建聚合内容，方法是索引其他机构（例如政府机构和邻近新闻媒体）最近发布的报道，然后对其进行摘要并作为新文章发布。目前并不清楚出版商通过这项合作能获得多少报酬，但Adweek称其为每年“五位数”的金额。作

Sora阴影之下，焦虑的中国AI

“跟不上的可能就要被淘汰了。”看到Sora演示视频后，从业10多年的动画制作师黄斌得出了这样的判断。随着影视业失业潮呼声渐起，Sora的诞生也给中国AI行业带来了巨大的焦虑。360集团创始人周鸿祎认为，Sora模型展现出了超越当前中国同类产品的性能和技术水平，这不仅体现在Sora可能实现通用人工智能（AGI）的时间表上，还体现在其实际应用效果和创新能力上。更有甚者，网上流传着“Sora的诞生是牛顿时刻”的说法，认为Sora代表了新一轮产业革命的兴起。事实上，国内在经过“百模大战”之后，才刚刚在文本模型上取得显著成果，达到或超过GPT-3.5的水平，并正朝着GPT-4的方向努力追赶。但Sora的

AI技术的发展，对数字经济到底有什么用？

人工智能(AI)产业是数字经济的重要组成部分。企业在数字化转型的早期实践中，比较关心基础类数据应用，比如基于查数、用数的管理支持或流程支持。数据本身即产品，这是不少从事数字化工作者的直观逻辑。当数据治理完成后，能够看到这些数据并清楚地知道这些数据的真实业务含义，就已经相当不错了。人工智能的应用，是数字化转型的未来趋势。近期的大模型产业之流行，也将这个趋势拉上了一个新的高度。越来越多的企业开始认识到，人工智能技术正是数字化2.0的核心要义。从数字化，到数智化，这是一个新赛道。很多传统的软件厂商都会面临挑战。传统的SaaS逻辑，ERP逻辑，本质上是以流程为中心进行方案设计和IT实施。而在智能化的浪

知名AI研究者深挖谷歌Gemma：参数不止70亿，设计原则很独特

就在几天前，开源大模型领域迎来了重磅新玩家：谷歌推出了全新的开源模型系列「Gemma」。相比Gemini，Gemma更加轻量，同时保持免费可用，模型权重也一并开源了，且允许商用。谷歌发布了包含两种权重规模的模型：Gemma2B和Gemma7B。尽管体量较小，但Gemma已经「在关键基准测试中明显超越了更大的模型」，包括Llama-27B和13B，以及风头正劲的Mistral7B。与此同时，关于Gemma的技术报告也一并放出。相信大家已经对Gemma的相关内容进行了系统研究，本文知名机器学习与AI研究者SebastianRaschka向我们介绍了Gemma相比于其他LLM的一些独特设计原则。Ra

生成式AI能拯救电信行业吗？

在日前正在举办的MWC2024大会上，英伟达发布了一系列公告，其中包括与ARM、ServiceNow和软银的合作，成立AI-RAN联盟，以及与挪威电信达成一项重大协议，该协议将使挪威电信获得英伟达最新的硬件和企业AI软件，以支持其运营中采用的许多人工智能用例。探讨电信行业与生成式AI之间更广泛的关系英伟达全球电信业务发展主管ChrisPenrose在接受行业媒体采访时对电信行业与生成式AI之间更广泛的关系进行了探讨。当被问及电信行业面临的最大问题时，他说：“我想说的是，电信公司目前在5G方面进行了大量投资，但这并不一定转化为收入的显著提升。他们需要找到能够确保投资得到回报的方法。在早期，很多人

【AI助力制图】用AI画红外高科技相机/产品效果图，放在PPT里太炸裂

AI助力制图：打造高科技产品效果图，PPT再也不会平淡无奇！在当今科技发展飞速的时代，人工智能的应用已经渗透到了各个领域，其中包括图像制图领域。传统的图像制图往往需要大量的时间和专业技能，而随着人工智能技术的不断进步，AI已经成为了制图的得力助手。特别是在绘制高科技产品效果图这一领域，AI的应用更是为设计师们带来了全新的体验。红外相机作为一种高科技产品，其特殊的功能和外观设计常常让人望而生畏。然而，借助人工智能，制图师们可以轻松地创造出逼真细腻的产品效果图，为观众呈现出一个个惊艳的视觉盛宴。与传统的制图方式相比，利用人工智能制作红外高科技相机产品效果图的优势不言而喻。首先，AI可以根据设计师提